Supercharge your LLM performance with Amazon SageMaker Large Model Inference container v15
今天,我们很高兴地宣布,由VLLM 0.8.4驱动的Amazon Sagemaker大型推理(LMI)容器V15的推出,并支持VLLM V1发动机。该版本引入了显着的性能提高,扩展的模型兼容性与多模态(即能够理解和分析文本到文本,图像到文本和文本映射数据),并与VLLM提供内置的集成,以帮助您无人接缝和最高绩效的大型性能(LLMS)具有最高的性能。
Accuracy evaluation framework for Amazon Q Business – Part 2
在本系列的第一篇文章中,我们引入了Amazon Q Business的全面评估框架,Amazon Q Business是一个完全管理的检索增强发电(RAG)解决方案,该解决方案使用了您公司的专有数据,而没有管理大型语言模型(LLMS)的复杂性。第一篇文章着重于选择适当的用例,准备数据并实施指标[…]
Use Amazon Bedrock Intelligent Prompt Routing for cost and latency benefits
今天,我们很高兴地宣布亚马逊基岩智能及时路由的一般可用性。在这篇博客文章中,我们详细介绍了内部测试的各种亮点,如何开始,并指出一些警告和最佳实践。我们鼓励您将Amazon Bedrock智能及时路由纳入您的新的和现有的生成AI应用程序中。
在这篇文章中,我们探讨了Infosys如何开发Infosys事件AI来解锁事件和会议产生的见解。通过其功能套件(包括实时转录,智能摘要和交互式聊天助手)Infosys Event AI使活动知识可访问,并在活动期间和活动结束后为与会者提供了沉浸式的参与解决方案。
Amazon Bedrock Prompt Optimization Drives LLM Applications Innovation for Yuewen Group
今天,我们很高兴地宣布在亚马逊基岩上迅速优化。使用此功能,您现在可以使用单个API调用或单击Amazon Bedrock控制台上的按钮来优化几个用例的提示。在这篇博客文章中,我们讨论了如何提示优化改善Yuewen Group中智能文本处理任务的大语言模型(LLMS)的性能。
Build a location-aware agent using Amazon Bedrock Agents and Foursquare APIs
在这篇文章中,我们将Amazon Bedrock代理商和FourSquare API结合在一起,以演示如何使用位置感知的代理为您的用户带来个性化的响应。
在这篇文章中,我们使用亚马逊基岩的多代理功能来展示一种强大而创新的AWS成本管理方法。通过使用Amazon Nova FMS的高级功能,我们开发了一种解决方案,该解决方案展示了AI驱动的代理如何彻底改变组织分析,优化和管理其AWS成本的方式。
Stream ingest data from Kafka to Amazon Bedrock Knowledge Bases using custom connectors
在这篇文章中,我们使用Amazon Managed Streaming为Apache Kafka(Amazon MSK)构建的自定义连接器和主题实现了一个带有亚马逊基岩知识库的RAG架构,该架构可能有兴趣了解股票价格趋势。
Add Zoom as a data accessor to your Amazon Q index
这篇文章演示了缩放用户如何在其缩放界面中直接访问其Amazon Q Business Enterprise数据,从而减轻了在维护企业安全边界的同时在应用程序之间切换的需求。现在,组织可以将Zoom配置为Amazon Q业务中的数据登录器,从而在其Amazon Q Index和Zoom AI Companion之间无缝集成。这种集成使用户可以直接在Zoom平台内以受控方式访问其企业知识。
Automate video insights for contextual advertising using Amazon Bedrock Data Automation
亚马逊基岩数据自动化(BDA)是由FMS在亚马逊基岩中提供动力的新型托管功能。 BDA从非结构化内容(包括文档,图像,视频和音频)提取结构化输出,同时减轻了对复杂自定义工作流程的需求。在这篇文章中,我们演示了BDA如何自动提取丰富的视频见解,例如章节和音频段,检测场景中的文本,并分类交互式广告局(IAB)分类学,然后使用这些见解来构建非线性广告解决方案,以增强上下文广告的有效性。
How Salesforce achieves high-performance model deployment with Amazon SageMaker AI
这篇文章是Salesforce和AWS之间的共同合作,并且在Salesforce Engineering Blog和AWS机器学习博客上都在交叉发布。 Salesforce AI模型服务团队正在努力突破自然语言处理的界限和企业应用程序的AI功能。他们的关键重点领域包括优化大型[…]
Automate Amazon EKS troubleshooting using an Amazon Bedrock agentic workflow
在这篇文章中,我们演示了如何编排多个亚马逊基岩代理商来创建复杂的亚马逊EKS故障排除系统。通过启用专业代理商之间的合作(来自K8SGPT的见解并通过ARGOCD框架执行行动),您可以建立一个全面的自动化,以最少的人为干预来识别,分析和解决集群问题。
Host concurrent LLMs with LoRAX
在这篇文章中,我们探讨了如何使用低排名适应性(LORA)有效地解决这些挑战。具体而言,我们讨论了使用Lora交换(Lorax)(Lorax)和Amazon Elastic Compute Cloud(Amazon EC2)GPU实例的讨论,允许组织有效地管理和服务不断增长的精细模型,优化成本,优化成本,并为客户提供无缝绩效。
Clario enhances the quality of the clinical trial documentation process with Amazon Bedrock
Clario和AWS之间的合作证明了AWS AI和机器学习(AI/ML)服务的潜力和生成的AI模型,例如Anthropic的Claude,以简化生命科学行业的文档生成过程,具体来说,特别是对于复杂的临床试验过程。
Optimizing Mixtral 8x7B on Amazon SageMaker with AWS Inferentia2
这篇文章演示了如何在AWS推理的实例上部署和服务Mixtral 8x7b语言模型,以进行具有成本效益,高性能推断。我们将使用拥抱面孔的最佳神经元进行模型汇编,该神经元提供了一组工具,可直接加载,训练和推理以及文本生成推理(TGI)容器,该容器具有用于部署和服务LLMS与HOUGGingFace的工具套件。
Build multi-agent systems with LangGraph and Amazon Bedrock
这篇文章演示了如何将开源多代理框架Langgraph与Amazon Bedrock集成。它解释了如何使用Langgraph和Amazon Bedrock来构建使用基于图的编排的功能强大的交互式多代理应用程序。
Dynamic text-to-SQL for enterprise workloads with Amazon Bedrock Agents
这篇文章演示了企业如何使用Amazon Bedrock代理实现可扩展的代理To To To-SQL解决方案,并具有高级错误处理工具和自动架构发现以提高数据库查询效率。
Building an AIOps chatbot with Amazon Q Business custom plugins
在这篇文章中,我们演示了如何为Amazon Q业务使用自定义插件来构建可以使用自然语言提示与多个API交互的聊天机器人。我们展示了如何构建AIOPS聊天机器人,该聊天机器人使用户可以通过自然语言查询和命令与其AWS基础架构进行交互。聊天机器人能够处理诸如查询有关亚马逊弹性计算云(Amazon EC2)端口的数据和Amazon Simple Storage Service(Amazon S3)的数据库访问设置。